یادگیری تقویتی

سال تحصیلی ۱۴۰۱-۱۴۰۲ فصل پائیز

مدرس: محسن هوشمند

پیشنهاد تحقیق

تعداد اعضاء ارائهء موضوع نام مقله نام اعضا
تک نفری 2013 Playing Atari with Deep Reinforcement Learning (DQN) جواد اصغری
دو نفری 2016 Mastering the game of Go with deep neural networks and tree search (Alpha Go) حسین رضائی
2017 Mastering the game of Go without human knowledge (AlphaGo Zero) ایضا
2018 A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play (Alpha Zero) ایضا
تک نفری 2010 Double Q-learning
2016 Deep Reinforcement Learning with Double Q-Learning
2018 Addressing Function Approximation Error in Actor-Critic Methods
تک نفری 2018 Reinforcement learning for solving the vehicle routing problem امیر خلیلی
تک نفری 2019 Human-level performance in 3D multiplayer games with population-based reinforcement learning
تک نفری 2019 Learning to Optimize Join Queries With Deep Reinforcement Learning

مطالب درسی

عنوان مبحث تاریخ تمرین منبع مطالعه
معرفی و مقدمات نه مهر
کاوش در مقابل بهره‌برداری شانزده مهر ساتن و بارتو - فصل دوم
هژده مهر ساتن و بارتو - فصل دوم
بیست و سه مهر ساتن و بارتو - فصل دوم
بیست و پنج مهر ساتن و بارتو - فصل دوم
سی مهر تمرین صفر ساتن و بارتو - فصل دوم
فرایند تصمیم مارکوف دو آبان ساتن و بارتو -فصل سوم
هفت آبان ساتن و بارتو -فصل سوم
نه آبان ساتن و بارتو -فصل سوم
چهارده آبان ساتن و بارتو -فصل سوم
برنامه‌ریزی پویا شانزده آبان ساتن و بارتو -فصل چهارم
بیست و یک آبان ساتن و بارتو -فصل چهارم
بیست و سه آبان ساتن و بارتو -فصل چهارم
روش مونت کارلو بیست و هشت آبان ساتن و بارتو -فصل پنجم
سی آبان ساتن و بارتو -فصل پنجم
پنج آبان ساتن و بارتو -فصل پنجم
تفاضل زمانی هفت آبان تمرین یک ساتن و بارتو -فصل ششم